La Statistica come Mappatura
Una statistica è formalmente definita come una funzione $h: \mathbb{R}^n \to \mathbb{R}$. Definiamo la probabilità che la statistica cada in un insieme $B$ utilizzando l'immagine inversa:
$$h^{-1} B = \{(x_1, x_2, \dots, x_n) : h(x_1, x_2, \dots, x_n) \in B\}$$
Il Fondamento I.I.D.
Per un campione di variabili casuali i.i.d. (indipendenti e identicamente distribuite), la probabilità congiunta di un punto campionario specifico $(x_1, \dots, x_n)$ è il prodotto delle loro probabilità marginali: $p(x_1)p(x_2)\dots p(x_n)$. Questo prodotto serve da peso per ciascun punto quando si calcola la probabilità totale che la statistica assuma un valore specifico.
Consideriamo una popolazione discreta in cui $p_X(1) = 1/2$, $p_X(2) = 1/4$ e $p_X(3) = 1/4$. Estraiamo un campione di dimensione $n=2$ ($X_1, X_2$) e definiamo la nostra statistica come la media geometrica: $Y_2 = (X_1 X_2)^{1/2}$.
Per trovare la distribuzione di $Y_2$, elenchiamo tutte le 9 coppie possibili $(X_1, X_2)$, calcoliamo la loro probabilità congiunta e il valore risultante di $Y_2$:
| Coppia $(x_1, x_2)$ | Prob $P(x_1)P(x_2)$ | $Y = \sqrt{x_1 x_2}$ |
|---|---|---|
| (1, 1) | 1/4 | 1,000 |
| (1, 2), (2, 1) | 1/8 + 1/8 = 1/4 | 1,414 |
| (1, 3), (3, 1) | 1/8 + 1/8 = 1/4 | 1,732 |
| (2, 2) | 1/16 | 2,000 |
| (2, 3), (3, 2) | 1/16 + 1/16 = 1/8 | 2,449 |
| (3, 3) | 1/16 | 3,000 |
Distribuzioni Esatte vs. Asintotiche
Prima di passare ai teoremi limite come il Teorema del Limite Centrale (CLT), dobbiamo padroneggiare la "Distribuzione Esatta". Ciò implica il calcolo della funzione specifica di massa o densità di probabilità per una statistica data una piccola dimensione campionaria finita $n$. Quando la forma analitica diventa intrattabile, ci si affida a simulazioni numeriche come le **approssimazioni Monte Carlo**.